老司机速成班开课!人工智能用《GTA》学开车
侠盗猎车也能训练AI
人工智能实验室OpenAI近日开源一套通过《侠盗猎车手》学习的自动驾驶系统,只需要一部电脑、购买一套游戏,人人都可以开发出自动驾驶系统。
可训练自动驾驶系统避免碰撞、
到达目的地、维持在道路中央等
由OpenAI开源的自动驾驶训练项目来自“DeepDrive”,其在2015年将《侠盗猎车手》改为适合训练自动驾驶系统的环境(如拿掉游戏中的暴力或违法元素),再将游戏作为自动驾驶系统的训练模拟器,强化系统避免碰撞、到达目的地、维持在道路中央等驾驶行为。
▲正在游戏中开车的人工智能
OpenAI将DeepDrive整合进旗下训练AI的虚拟世界Universe,并于近日开源,将繁琐的事前环境设置简化到只需20分钟即可完成。
开源项目除包含将游戏设定为适合训练自动驾驶的程序码,也提供已训练了21小时、相当于60万帧图像的“代理程序”。
就好比你的“自动驾驶司机”已经从驾校学了开车的基本手法和理论,至于之后如何发展需要接回家自己再训练。
▲比如在游戏的环境中设置雨雪、大雾等极端天气
自动驾驶系统如同其他人工智能,必须通过大量数据学习。不过,真实世界收集数据的速度有限,相比之下,来自电脑合成并自动标记注释的数据,不仅快速且品质稳定,可加速人工智能训练。
人工智能界的泥石流
DeepDrive隶属的OpenAI项目一直都是人工智能训练界的一股泥石流,他们的大量项目都是用各种PC、主机、手机游戏来训练人工智能。
▲小羊跳跃、一笔画、赛车游戏……这些都是用来训练AI的
而《侠盗猎车手》的高拟真环境,正好相当适合训练自动驾驶系统。该游戏的场景范围约是1/5个洛杉矶大,路况包含蜿蜒的城市街道、山区、沙漠和高速公路,提供广泛多样的训练场景,且每种场景都能搭配14种不同天气,以及257种不同汽车和7种脚踏车。
通过不同场景、天气和交通工具的排列组合,自动驾驶系统能在短时间内在大量场景中学习。
减少训练成本和时间、
让自驾车上路测试前更安全
用《侠盗猎车手》这类的虚拟环境训练人工智能,优势在于可快速处理用于机器学习的数据,自动将场景内的物件分类,例如汽车、行人、自行车、动物、路面、交通标志等,省去辨认和分析的时间及成本。在真实世界,单是收集街道图像和标记物件,都要耗费上千小时。
▲毕竟真实驾驶环境中路上会遇到各种各样的情况
此外,DeepDrive可加速测试过程、减少测试成本。
过去,要训练AI处理特定事件,如在结冰的道路上行驶,需收集上千小时的道路驾驶经验,但通过游戏模拟器,便可让系统直接针对特定场景学习。这也让自动驾驶系统在实际上路测试前变得更安全,因为在上路前他们已经历过大量模拟事件。
这套开源的程序给了更多人探索自动驾驶的可能,但自动驾驶距离“秋名山车神”的设定还有很长一段路可走。
科技画报#火箭君的小伙伴#
请关注效率火箭获取更多相关内容
更多内容